02. 连续分布

连续 vs 离散

高斯分布是一种连续型概率分布。因此,在深入学习高斯分布之前,我们先复习一下连续分布与离散分布之间的区别。

提示一下,连续型概率分布同高度、重量、距离、速度、角度等连续变量相关。

你已接触过均匀连续概率分布,比如下面这个例子。

另一方面,离散分布则与取特定值的变量相关,比如抛硬币、掷骰子或是在网格中定位。下面是一个离散分布的例子。

连续分布

均匀连续概率分布只是众多连续型概率分布中的一种。查看 Wikipedia 连续分布列表 的相关页面,感受一下它们的数量之庞大。

这些概率分布究竟有什么共同点?它们都代表了 连续变量 事件发生的概率。在不同情况下会运用不同的分布。

例如,在研究旋转轮盘的概率模型时,你会用到均匀分布。而在探究传感器数据的不确定性时,你将会用到高斯分布。

高斯分布

为了了解无人驾驶的不确定性,你至少需要掌握高斯分布的基础知识。例如,在研究传感器数据的不确定性或是确定行人的位置时,往往会应用高斯分布。

接下来,本课程将简要介绍高斯分布和它的起源。

然而,这并不是一门纯统计课程。我们只是对这种分布进行简单介绍,同时假设你已经熟悉了平均值、标准差、总体和样本等术语,其中:

  • 总体 指全部数据点的集合。例如,当你在测量人们的体重时,总体便是世界上的全部人口。
  • 样本 指总体中的一部分。在上面体重的例子中,测量世界上所有人的体重并不现实,因此你也许会从总体中随机选择样本。
  • 均值 指平均值。在上面这个例子中它指全部人口的平均体重。
  • 标准差 能测量数据的分布。这组数据是趋于围绕平均值分布,还是趋于离散?

如果你并不熟悉这些术语,或是需要复习,这些资源对你来说也许有用: 样本 vs 总体